Diffusion による Text2Image の系譜と生成画像が動き出すまで
https://speakerdeck.com/nhamanasu/diffusionniyorutext2imagenoxi-pu-tosheng-cheng-hua-xiang-gadong-kichu-sumade
Diffusion による Text2Image の系譜と生成画像が動き出すまで
著 : 清水遼平 (株式会社 DeNA)
キーワード : 画像生成 AI
前提知識
深層学習
生成モデル
Transformer
Diffusion 基礎
拡散モデル (Diffusion モデル) とは
DDPM
DDIM
改良型 DDPM
Text2Image の系譜
CLIP
自然言語と画像を同一特徴量空間で近づける
研究界隈の動き
GLIDE
Latent Diffusion Models (LDM)
DALL・E 2
Text2Image の知名度を上げた立役者
Imagen
Re-Imagen
ERNIE-ViLG 2.0
UPainting
eDiff-I
Scene-Composer
ReCo
SpaText
UniD3
Composer
大衆化
DiscoDiffusion
OSS としての高品質 Text2Image の先駆け
MidJourney
Stable Diffusion : イラスト系の生成品質に優れる
Stable Diffusion web UI
InvokeAI
Waifu Diffusion
ゲームチェンジャー
NovelAI Diffusion : イラスト調生成の金字塔
進化
NijiJourney : MidJourney の派生
Anything
HuggingFace、Civtai
Danbooru
日刊 画像生成 AI
爆発的な普及による弊害と警鐘
著作権などの権利問題
Text2Video へ
Video Diffusion Models
Make-A-Video
Imagen Video
MagicVideo
Tune-A-Video
Gen-1
#スライド #文献